Исследования случаев
Углубленное обучение на основе реляционных диаграмм
Институт автоматизации Академии наук Китая
CAS, реляционная карта, глубокое усиленное обучение, роботы, многоцелевое окружение
Роботы

В области исследований мультироботизированных систем контроль окружения является важной темой. Он широко используется как в гражданской, так и в военной областях, включая скоординированное сопровождение, захват целей противника, разведку и наблюдение, патрулирование беспилотных надводных кораблей и охоту.

Основная проблема в этих приложениях заключается в том, как управлять мультироботизированными системами, связанными с многоцелевым распределением, одновременно решая проблемы окружения целей и предотвращения столкновений. Это создает серьезные проблемы, особенно для децентрализованных мультироботизированных систем.

Команда профессора Пу Чжицяна из Института автоматизации Китайской академии наук представила документ на конференции ICRA 2022. Они предложили метод глубокого интенсивного обучения, основанный на реляционной диаграмме, который демонстрирует хорошую адаптивность к проблемам многоцелевого окружения от столкновений (MECA) в различных условиях.

ieeexplore

ieeexplore

Выражение вопроса

Исследование назначило миссию MECA, в которой среда с L статическими препятствиями (черными кругами) включает в себя мультироботизированную систему, состоящую из N роботов (зеленых кругов). Цель состоит в том, чтобы совместно окружить K (1 < K < N) неподвижную или движущуюся цель (красный круг).

Все роботы должны самостоятельно формировать несколько групп, чтобы окружить все цели. Каждая группа должна формировать круговую группу, чтобы окружить одну цель, избегая при этом столкновения. Это предполагает решение следующих трех подтем:

1) Динамическое многоцелевое распределение и группировки

2) Каждая группа окружает цель

3) Предотвращение столкновений между группами

Illustration of MECA for a decentralized multi-robot system

Диаграмма MECA для децентрализованной многороботизированной системы

Методы

В контексте проблемы MECA существует три типа объектов: роботы, цели и препятствия. Отношения столкновений между различными объектами и роботами различны, например, избегание препятствий, окружение цели и сотрудничество с другими роботами.

В исследовании предлагается децентрализованный метод глубокого интенсивного обучения (DRL), основанный на диаграмме отношений уровня робота и уровня цели (RG), известный как метод MECA - DRL - RG.

Четко:

Моделирование и обучение RG роботизированного класса с использованием графической сети внимания (GATS). Эти RG состоят из трех изомерных диаграмм отношений между каждым роботом и другими роботами, целями и препятствиями.

Используйте GAT для построения RG целевого уровня и захвата пространственных отношений между роботом и различными целями. Целевое движение моделируется целевым классом RG и предсказывает траекторию цели, контролируя обучение.

Кроме того, определена сложная функция вознаграждения, встроенная в знание для решения многоцелевых задач в MECA. Алгоритм обучения Actor - Critic, основанный на централизованном обучении и децентрализованном исполнении, используется для обучения стратегических сетей.

Overall structure of MECA-DRL-RG

Общая структура MECA - DRL - RG

Эксперимент

Команда провела симуляционные эксперименты и эксперименты в реальных условиях. В реальных экспериментах сценарий был следующим: шесть роботов окружили две движущиеся цели в среде с двумя препятствиями. Данные о местоположении и скорости робота регистрируются системой захвата движения NOKOV.

Snapshots of 6 robots encircling 2 targets in 2 obstacle environment

Шесть роботов окружили две цели в двух обстановках

Как симуляционные, так и реальные эксперименты подтвердили, что метод MECA - DRL - RG позволяет роботам изучать изомерные карты пространственных отношений из окружающей среды по сравнению с другими методами. Это позволяет им прогнозировать траекторию цели, тем самым улучшая понимание и прогнозирование окружения каждого робота. Была подтверждена эффективность метода MECA - DRL - RG.

Кроме того, независимо от увеличения числа роботов, препятствий или целей или ускорения движения цели, метод MECA - DRL - RG продемонстрировал отличную производительность и широкую адаптацию.

Training curves of MECA-DRL-RG

Тренировочная кривая MECA - DRL - RG

Ссылки:

Чжан Тао, Лю, Пу, Йи, « Окружение многоцелевым предотвращением столкновений с использованием реляционной карты для глубокого интенсивного обучения», 2022 год, Международная конференция по робототехнике и автоматизации, Филадельфия, Пенсильвания, США, стр. 8794 - 8800, doi: 10.109 / ICRA46639.22.981251.

Пожалуйста, свяжитесь с нами

  • Мы прилагаем все усилия для того, чтобы помочь вам в ваших запросах и предоставить полную информацию.

    Поделитесь с нами своими проблемами, и мы быстро направим вас к наиболее эффективному решению.

  • Объем захвата * m m m
  • Объекты для отслеживания *
  • Количество целей (необязательно)
  • Тип камеры (по желанию)
  • Количество камер (необязательно)
  • Отправить
Контакт

Свяжитесь с нами

Используя данный сайт, Вы соглашаетесь с нашими условиями, которые описывают наше использование файлов cookie. CLOSE ×